package com.yufei.utils;



import java.util.List;

import com.yufei.entity.CatalogKeys;
public class ClusterUtils {
	/**
	 * @param text
	 * @param catalogKeys
	 * @return
	 * 此种聚类针对那些商品分类比较敏感的关键字（即某个商品的标题包含某个关键字，
	 * 那么就可以很大概率的肯定此商品及时那个关键字对应的分类）
	 */
	public static Long clusterSimplely(String text,List<CatalogKeys> catalogKeys){
		Long catalogId=null;
		for(CatalogKeys catalogKey:catalogKeys){
			if(catalogKey==null||catalogKey.getKeyWords().size()==0){
				continue;
			}
			if(text.contains(catalogKey.getKeyWords().get(0))){
				catalogId=catalogKey.getCatalogId();
				break;
			}
			
		}
		return catalogId;
	}

	 //根据TF-IDF算法来提取训练数据的特征关键字
	
	public static void clusterByTFIDF(String text,List<CatalogKeys> catalogKeys){
		
	}

}
